دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
دسته بندی: فن آوری ویرایش: نویسندگان: Sumanta Karmakar. Pratik Dey سری: ناشر: Technical and Scientific Publisher سال نشر: 0 تعداد صفحات: 11 زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 474 کیلوبایت
کلمات کلیدی مربوط به کتاب تشخیص بلندگو [Ch. 1 تنها]: تشخیص بلندگو
در صورت تبدیل فایل کتاب Speaker Recognition [Ch. 1 ONLY] به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب تشخیص بلندگو [Ch. 1 تنها] نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
ویرایش گفتار چیزی نیست جز حرکت در مورد چند آرایه از اعداد. از فیلترهای تقویتی می توان برای حذف نویز طبیعی و عمدی تا حد معقولی استفاده کرد. و تجزیه و تحلیل زیر و بم و فرمت را می توان برای ارائه یک ایده کلی در مورد اینکه آیا دو گوینده یک شخص هستند یا نه استفاده کرد. همچنین عوامل دیگری، فراتر از تنوع بلندگو، وجود دارد که چالشی را برای فناوری تشخیص بلندگو ایجاد می کند. نمونههایی از این موارد نویز صوتی و تغییرات در محیطهای ضبط است (مثلاً بلندگو از گوشیهای مختلف تلفن استفاده میکند). با این حال، این نقص در مقایسه شکل موج آشکار است. در حالی که می توان از این رویکردها برای ارائه یک تخمین تقریبی یا کمک به تصمیم گیری انسان در مورد یکسان بودن دو صدا استفاده کرد، برنامه های کامپیوتری مانند این به سادگی آنقدر پیشرفته نیستند که کاملاً خودکار و بی خطا باشند. به عبارت دیگر، این یک جعبه سیاه نیست که در آن شما مجبور نباشید چیزی در مورد نحوه عملکرد برنامه بدانید و فقط انتظار یک پاسخ دقیق را بر اساس مجموعه مشخصی از ورودی ها داشته باشید. چیزهای دیگری که میخواهیم در این موضوع بررسی کنیم شامل ضرایب دلتا-سپستروم و ضرایب پیشبینی خطی ادراکی است تا ببینیم چقدر میتوانند به تجزیه و تحلیل گام و فرمانت کمک کنند یا جایگزین آنها شوند. شاید ترکیبی از هر چهار درصد تائید بسیار بالاتری داشته باشد.
Speech editing is nothing more than moving about some arrays of numbers. Enhancement filters can be used to remove both natural and intentional noise, to a reasonable extent. And pitch and formant analysis can be used to give a general idea of whether two speakers are the same person or not. There are also other factors, beyond speaker variability, that present a challenge to speaker recognition technology. Examples of these are acoustical noise and variations in recording environments (e.g. speaker uses different telephone handsets).The defect, however, are obvious in the waveform comparison. While these approaches can be used to give a rough estimate or to aid in human decisions about whether two voices are the same, computer programs like these are simply not advanced enough to be completely automated and foolproof. In other words, this is not a black box where you do not have to know anything about how the program works and just expect an accurate answer based on a certain set of inputs. Other things that we would like to explore in the subject include Delta-Cepstrum coefficients and perceptual linear predictive coefficients in order to see how much they could help with or replace pitch and formant analysis. Maybe a combination of all four would give a much higher confirmation percentage.